1. Identificação | |
Tipo de Referência | Tese ou Dissertação (Thesis) |
Site | mtc-m21b.sid.inpe.br |
Código do Detentor | isadg {BR SPINPE} ibi 8JMKD3MGPCW/3DT298S |
Identificador | 8JMKD3MGP3W34P/3K6JNQ8 |
Repositório | sid.inpe.br/mtc-m21b/2015/08.31.17.43 |
Última Atualização | 2016:01.27.11.18.14 (UTC) administrator |
Repositório de Metadados | sid.inpe.br/mtc-m21b/2015/08.31.17.43.36 |
Última Atualização dos Metadados | 2018:06.04.02.55.38 (UTC) administrator |
Chave Secundária | INPE-17606-TDI/2374 |
Chave de Citação | Makiyama:2015:CaStSD |
Título | Text mining applied to SQL queries: a case study for SDSS SkyServer |
Título Alternativo | Mineração de texto aplicado a consultas SQL: um estudo de caso para SDSS SkyServer |
Curso | CAP-COMP-SPG-INPE-MCTI-GOV-BR |
Ano | 2015 |
Data | 2015-09-21 |
Data de Acesso | 08 maio 2024 |
Tipo da Tese | Dissertação (Mestrado em Computação Aplicada) |
Tipo Secundário | TDI |
Número de Páginas | 75 |
Número de Arquivos | 1 |
Tamanho | 1056 KiB |
|
2. Contextualização | |
Autor | Makiyama, Vitor Hirota |
Banca | Vijaykumar, Nandamudi Lankalapalli (presidente) Santos, Rafael Duarte Coelho dos (orientador) Gomes, Karine Reis Ferreira Queiroz, Gilberto Ribeiro de Musa, Daniela Leal |
Endereço de e-Mail | vitor.hirota@gmail.com |
Universidade | Instituto Nacional de Pesquisas Espaciais (INPE) |
Cidade | São José dos Campos |
Histórico (UTC) | 2015-08-31 17:45:02 :: vitor.hirota@gmail.com -> yolanda :: 2015-09-03 13:22:43 :: yolanda -> administrator :: 2015-09-09 10:08:30 :: administrator -> vitor.hirota@gmail.com :: 2015-10-23 18:05:04 :: vitor.hirota@gmail.com -> yolanda :: 2016-01-27 11:20:10 :: yolanda -> marcelo.pazos@sid.inpe.br :: 2016-02-01 17:24:07 :: marcelo.pazos@sid.inpe.br :: -> 2015 2016-02-01 17:37:53 :: marcelo.pazos@sid.inpe.br -> administrator :: 2015 2018-06-04 02:55:38 :: administrator -> :: 2015 |
|
3. Conteúdo e estrutura | |
É a matriz ou uma cópia? | é a matriz |
Estágio do Conteúdo | concluido |
Transferível | 1 |
Palavras-Chave | text mining SQL KDD SDSS mineração de texto |
Resumo | SkyServer, the Internet portal for the Sloan Digital Sky Survey (SDSS) catalog, provides a set of tools that allows data access for astronomers and scientific education. One of the available interfaces allows users to enter ad-hoc SQL statements to query the catalog, and has logged over 280 million queries since 2001. To assess and investigate usage behavior, log analyses were performed after the 5$^{th}$ and 10$^{th}$ year of the portal being in production. Such analyses, however, focused on the HTTP access, and just simple information for the database usage. This work aims to apply text mining techniques over the SQL logs to define a methodology to parse, clean and tokenize statements into an intermediate numerical representation for data mining and knowledge discovery, which can provide deeper analysis over SQL usage, and also has a number of foreseen applications in database optimization and improving user experience. RESUMO: SkyServer, o portal de Internet para o catálogo \emph{Sloan Digital Sky Survey} (SDSS), fornece um conjunto de ferramentas que permitem acesso a dados para astrônomos e para educação científica. Uma das interfaces disponíveis permite a inserção de instruções SQL ad-hoc para consultar o catálogo, e já recebeu mais de 280 milhões de consultas desde 2001. Para avaliar e investigar o comportamento de uso, análises de log foram realizadas após o 5$^{o}$ e 10$^{o}$ ano de vida do portal. Tais análises, no entanto, focaram no acesso HTTP, e apenas informações básicas de utlização do banco de dados. Este trabalho tem por objetivo aplicar técnicas de mineração de texto sobre os logs SQL com o intuito de definir uma metodologia para analisar, limpar e dividir em símbolos tais declarações em uma representação numérica intermediária para posterior mineração de dados e extração de conhecimento; possibilitando análises mais profundas sobre o uso de SQL, e também aplicações previstas em otimização de banco de dados e para melhora de experiência de usuário. |
Área | COMP |
Arranjo | urlib.net > CAP > Text mining applied... |
Conteúdo da Pasta doc | acessar |
Conteúdo da Pasta source | originais/@4primeirasPaginas-2.pdf | 23/11/2015 15:44 | 187.4 KiB | originais/Avaliação final pagina 2 do aluno Vitor Hirota Makiyama.pdf | 03/11/2015 10:31 | 27.0 KiB | originais/thesis.pdf | 29/10/2015 15:37 | 880.3 KiB | |
Conteúdo da Pasta agreement | |
|
4. Condições de acesso e uso | |
URL dos dados | http://urlib.net/ibi/8JMKD3MGP3W34P/3K6JNQ8 |
URL dos dados zipados | http://urlib.net/zip/8JMKD3MGP3W34P/3K6JNQ8 |
Idioma | en |
Arquivo Alvo | publicacao.pdf |
Grupo de Usuários | administrator marcelo.pazos@inpe.br vitor.hirota@gmail.com yolanda.souza@mcti.gov.br |
Grupo de Leitores | administrator marcelo.pazos@inpe.br vitor.hirota@gmail.com yolanda.souza@mcti.gov.br |
Visibilidade | shown |
Licença de Direitos Autorais | urlib.net/www/2012/11.12.15.10 |
Detentor da Cópia | SID/SCD |
Permissão de Leitura | allow from all |
Permissão de Atualização | não transferida |
|
5. Fontes relacionadas | |
Repositório Espelho | sid.inpe.br/mtc-m21b/2013/09.26.14.25.22 |
Unidades Imediatamente Superiores | 8JMKD3MGPCW/3F2PHGS |
Lista de Itens Citando | |
Acervo Hospedeiro | sid.inpe.br/mtc-m21b/2013/09.26.14.25.20 |
|
6. Notas | |
Campos Vazios | academicdepartment affiliation archivingpolicy archivist callnumber contenttype creatorhistory descriptionlevel dissemination doi electronicmailaddress format group isbn issn label lineage mark nextedition notes number orcid parameterlist parentrepositories previousedition previouslowerunit progress resumeid rightsholder schedulinginformation secondarydate secondarymark session shorttitle sponsor subject tertiarymark tertiarytype url versiontype |
|